Cos'è mediana statistica?

Mediana Statistica

La mediana è un valore numerico che separa la metà superiore di un campione, una popolazione o una distribuzione di probabilità dalla metà inferiore. In termini più semplici, è il valore "centrale" in un insieme di dati ordinato. A differenza della media aritmetica, la mediana è meno sensibile ai valori anomali (outlier).

Come si calcola la mediana?

  1. Ordinare i dati: Il primo passo è ordinare i dati dal più piccolo al più grande.
  2. Individuare il valore centrale:
    • Se il numero di dati (n) è dispari: La mediana è il valore che si trova nella posizione (n+1)/2.
    • Se il numero di dati (n) è pari: La mediana è la media dei due valori che si trovano nelle posizioni n/2 e (n/2)+1.

Esempio:

  • Set di dati dispari: 3, 6, 7, 8, 9. La mediana è 7 (la posizione è (5+1)/2 = 3).
  • Set di dati pari: 3, 6, 7, 8. La mediana è (6+7)/2 = 6.5 (le posizioni sono 4/2 = 2 e (4/2)+1 = 3).

Perché usare la mediana?

La mediana è una misura di tendenza centrale robusta, particolarmente utile quando:

  • I dati contengono valori anomali che potrebbero influenzare notevolmente la media.
  • La distribuzione dei dati è asimmetrica (non simmetrica). In questi casi, la mediana rappresenta meglio il "centro" dei dati rispetto alla media.
  • Si lavora con dati ordinali (dove l'ordine è importante ma non la distanza tra i valori).

Confronto con la media:

CaratteristicaMediaMediana
Sensibilità ai valori anomaliAltaBassa
Utile per distribuzioni simmetricheUtile anche, ma meno importante
Utile per distribuzioni asimmetricheNo
Richiede dati di intervallo o rapportoPuò essere usata anche con dati ordinali

In sintesi: La mediana è uno strumento statistico prezioso per comprendere la distribuzione dei dati, specialmente in presenza di valori anomali o distribuzioni asimmetriche. Offre una prospettiva diversa rispetto alla media, consentendo un'analisi più completa e accurata.